智能论文笔记

Flow Annealed Importance Sampling Bootstrap

Laurence Illing Midgley , Vincent Stimper , Gregor N. C. Simm , Bernhard Schölkopf , José Miguel Hernández-Lobato

分类：机器学习 | (统计)机器学习

2022-08-03

标准化流是可易处理的密度模型，可以近似复杂的目标分布，例如物理系统的玻尔兹曼分布。但是，当前的训练流量要么具有寻求模式的行为，要么使用昂贵的MCMC模拟事先生成的目标样本，要么使用具有很高差异的随机损失。为了避免这些问题，我们以退火重要性采样（AIS）增强流量，并最大程度地减少覆盖$ \ alpha $ -divergence的质量，并使用$ \ alpha = 2 $，从而最大程度地减少了重要性的重量差异。我们的方法是流动性Bootstrap（Fab），使用AIS在流动较差的目标区域中生成样品，从而促进了新模式的发现。我们以AIS的最小差异分布来定位，以通过重要性抽样来估计$ \ alpha $ -Divergence。我们还使用优先的缓冲区来存储和重复使用AIS样本。这两个功能显着提高了Fab的性能。我们将FAB应用于复杂的多模式目标，并表明我们可以在以前的方法失败的情况下非常准确地近似它们。据我们所知，我们是第一个仅使用非均衡目标密度学习丙氨酸二肽分子的玻璃体分布，而无需通过分子动力学（MD）模拟生成的样品：FAB与通过最大可能性训练更好的效果，而不是通过最大可能性产生的结果。在MD样品上使用100倍的目标评估。在重新获得重要权重的样品后，我们获得了与地面真相几乎相同的二面角的无偏直方图。

translated by 谷歌翻译

MACE: Higher Order Equivariant Message Passing Neural Networks for Fast and Accurate Force Fields

Ilyes Batatia , Dávid Péter Kovács , Gregor N. C. Simm , Christoph Ortner , Gábor Csányi

分类： (统计)机器学习 | 机器学习

2022-06-15

在计算化学和材料科学中，创建快速准确的力场是一项长期挑战。最近，已经证明，几个直径传递神经网络（MPNN）超过了使用其他方法在准确性方面构建的模型。但是，大多数MPNN的计算成本高和可伸缩性差。我们建议出现这些局限性，因为MPNN仅传递两体消息，从而导致层数与网络的表达性之间的直接关系。在这项工作中，我们介绍了MACE，这是一种使用更高的车身订单消息的新型MPNN模型。特别是，我们表明，使用四体消息将所需的消息传递迭代数减少到\ emph {两}，从而导致快速且高度可行的模型，达到或超过RMD17的最新准确性，3BPA和ACAC基准任务。我们还证明，使用高阶消息会导致学习曲线的陡峭程度改善。

translated by 谷歌翻译

Bootstrap Your Flow

Laurence Illing Midgley , Vincent Stimper , Gregor N. C. Simm , José Miguel Hernández-Lobato

分类：机器学习 | 人工智能 | (统计)机器学习

2021-11-22

归一化流量是灵活的，参数化分布，可用于通过重要性采样从难治性分布中的预期近似。然而，目前的基于流动的方法受到挑战目标的限制，其中它们患有模式寻求行为或在训练损失中的高方差，或依赖于目标分布的样本，这可能不可用。为了解决这些挑战，我们将流量与退火重点采样（AIS）相结合，同时使用$ \ Alpha $ - 在新颖的培训程序中使用$ \ Alpha $ - 作为我们的目标，在培训程序Fab（Flow AIS Bootstrap）中。因此，流动和AI以自动启动方式彼此改进。我们展示了FAB可以用于对复杂的目标分布产生准确的近似，包括Boltzmann分布，在前一种基于流基的方法失败的问题中。

translated by 谷歌翻译

Deep Learning Generates Synthetic Cancer Histology for Explainability and Education

James M. Dolezal , Rachelle Wolk , Hanna M. Hieromnimon , Frederick M. Howard , Andrew Srisuwananukorn , Dmitry Karpeyev , Siddhi Ramesh , Sara Kochanny , Jung Woo Kwon , Meghana Agni

分类：计算机视觉

2022-11-12

Artificial intelligence methods including deep neural networks (DNN) can provide rapid molecular classification of tumors from routine histology with accuracy that matches or exceeds human pathologists. Discerning how neural networks make their predictions remains a significant challenge, but explainability tools help provide insights into what models have learned when corresponding histologic features are poorly defined. Here, we present a method for improving explainability of DNN models using synthetic histology generated by a conditional generative adversarial network (cGAN). We show that cGANs generate high-quality synthetic histology images that can be leveraged for explaining DNN models trained to classify molecularly-subtyped tumors, exposing histologic features associated with molecular state. Fine-tuning synthetic histology through class and layer blending illustrates nuanced morphologic differences between tumor subtypes. Finally, we demonstrate the use of synthetic histology for augmenting pathologist-in-training education, showing that these intuitive visualizations can reinforce and improve understanding of histologic manifestations of tumor biology.

translated by 谷歌翻译

Optimal Connectivity through Network Gradients for the Restricted Boltzmann Machine

A. C. N. de Oliveira , D. R. Figueiredo

分类：机器学习

2022-09-14

最近证明利用稀疏网络连接深神经网络中的连续层，可为大型最新模型提供好处。但是，网络连接性在浅网络的学习曲线中也起着重要作用，例如经典限制的玻尔兹曼机器（RBM）。一个基本问题是有效地找到了改善学习曲线的连接模式。最近的原则方法明确将网络连接作为参数，这些参数必须在模型中进行优化，但通常依靠连续功能来表示连接和明确的惩罚。这项工作提出了一种基于网络梯度的想法来找到RBM的最佳连接模式的方法：计算每个可能连接的梯度，给定特定的连接模式，并使用梯度驱动连续连接强度参数又使用确定连接模式。因此，学习RBM参数和学习网络连接是真正共同执行的，尽管学习率不同，并且没有改变目标函数。该方法应用于MNIST数据集，以显示针对样本生成和输入分类的基准任务找到更好的RBM模型。

translated by 谷歌翻译

Variational Causal Inference

Yulun Wu , Layne C. Price , Zichen Wang , Vassilis N. Ioannidis , George Karypis

分类： (统计)机器学习 | 人工智能 | 机器学习

2022-09-13

当结果具有高维度时（例如基因表达，脉冲反应，人类的面部）和协方差相对有限，对传统因果推理和监督学习方法的估算是一项具有挑战性的任务。在这种情况下，要在反事实治疗下构建一个人的结果，至关重要的是要利用其在协变量之上观察到的事实结果中包含的个人信息。我们提出了一个深层的变异贝叶斯框架，该框架严格整合了在反事实处理下进行结果构建的两个主要信息来源：一个来源是嵌入高维事实结果中的个体特征；另一个来源是实际收到这种利益疗法的相似受试者（具有相同协变量的受试者）的响应分布。

translated by 谷歌翻译

Graph Neural Networks for Low-Energy Event Classification & Reconstruction in IceCube

R. Abbasi , M. Ackermann , J. Adams , N. Aggarwal , J. A. Aguilar , M. Ahlers , M. Ahrens , J. M. Alameddine , A. A. Alves Jr. , N. M. Amin

分类：机器学习

2022-09-07

ICECUBE是一种用于检测1 GEV和1 PEV之间大气和天体中微子的光学传感器的立方公斤阵列，该阵列已部署1.45 km至2.45 km的南极的冰盖表面以下1.45 km至2.45 km。来自ICE探测器的事件的分类和重建在ICeCube数据分析中起着核心作用。重建和分类事件是一个挑战，这是由于探测器的几何形状，不均匀的散射和冰中光的吸收，并且低于100 GEV的光，每个事件产生的信号光子数量相对较少。为了应对这一挑战，可以将ICECUBE事件表示为点云图形，并将图形神经网络（GNN）作为分类和重建方法。 GNN能够将中微子事件与宇宙射线背景区分开，对不同的中微子事件类型进行分类，并重建沉积的能量，方向和相互作用顶点。基于仿真，我们提供了1-100 GEV能量范围的比较与当前ICECUBE分析中使用的当前最新最大似然技术，包括已知系统不确定性的影响。对于中微子事件分类，与当前的IceCube方法相比，GNN以固定的假阳性速率（FPR）提高了信号效率的18％。另外，GNN在固定信号效率下将FPR的降低超过8（低于半百分比）。对于能源，方向和相互作用顶点的重建，与当前最大似然技术相比，分辨率平均提高了13％-20％。当在GPU上运行时，GNN能够以几乎是2.7 kHz的中位数ICECUBE触发速率的速率处理ICECUBE事件，这打开了在在线搜索瞬态事件中使用低能量中微子的可能性。

translated by 谷歌翻译

SNGuess: A method for the selection of young extragalactic transients

N. Miranda , J. C. Freytag , J. Nordin , R. Biswas , V. Brinnel , C. Fremling , M. Kowalski , A. Mahabal , S. Reusch , J. van Santen

分类：机器学习

2022-08-13

随着天文学中检测到的瞬变数量的迅速增加，基于机器学习的分类方法正在越来越多地使用。他们的目标通常是要获得瞬态的确定分类，并且出于良好的性能，他们通常需要存在大量观察。但是，精心设计，有针对性的模型可以通过更少的计算资源来达到其分类目标。本文介绍了Snguess，该模型旨在找到高纯度附近的年轻外乳旋转瞬变。 Snguess可以使用一组功能，这些功能可以从天文警报数据中有效计算。其中一些功能是静态的，并且与警报元数据相关联，而其他功能必须根据警报中包含的光度观测值计算。大多数功能都足够简单，可以在其检测后的瞬态生命周期的早期阶段获得或计算。我们为从Zwicky Transient设施（ZTF）的一组标记的公共警报数据计算了这些功能。 Snguess的核心模型由一组决策树组成，这些集合是通过梯度提升训练的。 SNGUESS建议的候选人中约有88％的ZTF从2020年4月至2021年8月的一组警报中被发现是真正的相关超新星（SNE）。对于具有明亮检测的警报，此数字在92％至98％之间。自2020年4月以来，Snguess确定为ZTF Alert流中潜在SNE的瞬变已发布到AMPEL_ZTF_NEW组标识符下的瞬态名称服务器（TNS）。可以通过Web服务访问ZTF观察到的任何暂时性的SNGUESS分数。 Snguess的源代码可公开使用。

translated by 谷歌翻译

Future Unruptured Intracranial Aneurysm Growth Prediction using Mesh Convolutional Neural Networks

Kimberley M. Timmins , Maarten J. Kamphuis , Iris N. Vos , Birgitta K. Velthuis , Irene C. van der Schaaf , Hugo J. Kuijf

分类：人工智能 | 计算机视觉

2022-07-27

颅内动脉瘤（UIA）的生长是破裂的预测指标。因此，为了进一步的成像监视和治疗计划，重要的是能够预测UIA是否会根据初始基线飞行时间MRA（TOF-MRA）增长。众所周知，UIA的大小和形状是动脉瘤生长和/或破裂的预测指标。我们对使用网状卷积神经网络进行基线TOF-MRA的未来UIA增长预测进行了可行性研究。我们包括151个TOF-MRA，其中169个UIA基于生长的临床定义，其中49个UIA被归类为生长，而120个UIA被归类为稳定（随访扫描中的大小> 1 mm）。从TOF-MRAS分割了UIA，并自动生成网格。我们研究了仅UIA网格的输入和包括UIA和周围母体血管在内的利益区域（ROI）网格。我们开发了一个分类模型来预测将增长或保持稳定的UIA。该模型由一个网状卷积神经网络组成，其中包括描述表面拓扑的形状指数和曲面的其他新型输入边缘特征。研究了输入边缘中点坐标是否影响模型性能。具有最高AUC（63.8％）的模型用于生长预测，使用了具有输入边缘中点坐标特征的UIA网格（平均F1得分= 62.3％，准确度= 66.9％，灵敏度= 57.3％，特异性= 70.8％）。我们提出了一个基于网状卷积神经网络的未来UIA增长预测模型，其结果有希望。

translated by 谷歌翻译

$\textit{FastSVD-ML-ROM}$: A Reduced-Order Modeling Framework based on Machine Learning for Real-Time Applications

G. I. Drakoulas , T. V. Gortsas , G. C. Bourantas , V. N. Burganos , D. Polyzos

分类：机器学习

2022-07-24

数字双胞胎已成为优化工程产品和系统性能的关键技术。高保真数值模拟构成了工程设计的骨干，从而准确地了解了复杂系统的性能。但是，大规模的，动态的非线性模型需要大量的计算资源，并且对于实时数字双胞胎应用而言是高度的。为此，采用了减少的订单模型（ROM），以近似高保真解决方案，同时准确捕获身体行为的主要方面。本工作提出了一个新的机器学习（ML）平台，用于开发ROM，以处理处理瞬态非线性偏微分方程的大规模数值问题。我们的框架被称为$ \ textit {fastsvd-ml-rom} $，利用$ \ textit {（i）} $单数值分解（SVD）更新方法，以计算多效性解决方案的线性子空间仿真过程，$ \ textIt {（ii）} $降低非线性维度的卷积自动编码器，$ \ textit {（iii）} $ feed-feed-feed-forderward神经网络以将输入参数映射到潜在的空间，以及$ \ textit {（iv））} $长的短期内存网络，以预测和预测参数解决方案的动力学。 $ \ textit {fastsvd-ml-rom} $框架的效率用于2D线性对流扩散方程，圆柱周围的流体问题以及动脉段内的3D血流。重建结果的准确性证明了鲁棒性，并评估了所提出的方法的效率。

translated by 谷歌翻译